תיאוריה בגרוש 2

מאזן העוצמה בין מזרח ומערב – איך אחוז הנצחונות של המזרח והמערב משתנה ככל שהעונה מתקדמת

לפני כמה זמן כתבתי טור שמטרתו היתה להציג מודל מאוד פשוט שמתאר איך הבדלים קטנים בין העוצמות של שני קונפרנסים יכולים להתפתח להבדלים מאוד גדולים אחרי כמה שנים [http://www.hoops.co.il/?p=42492]. כאן אני רוצה לתאר איך אחוז הנצחונות של הקונפרנסים משתנה ככל שהליגה מתקדמת. כמו בטור הקודם אני מניח שניתן להתייחס אל המזרח כאל מכלול אחד ואל המערב כאל מכלול בלי להיכנס לפרטים שכל קונפרנס מורכב מקבוצות שלא שוות בכוחן.

בתחילת העונה כל קונפרנס, מזרח או מערב, מתחיל עם כוח יחסי מסוים, e ו-w. כאן e ו-w מייצגים את אחוז הנצחונות בנקודת זמן מסוימת. הערך שלהם בתחילת העונה הוא "התוצר" של המודל הקודם.

אני מניח שהמזרח משחק α אחוז מהמשחקים נגד המזרח ואת השאר נגד המערב. אם  α=0.7 זה אומר שהמזרח משחק 70% מהמשחקים נגד עצמו ו-30% מהמשחקים נגד המערב.

נניח שבשבוע ישנם בממוצע שלושה משחקים. מה הוא השינוי של e בשבוע זה ? ובכן, אם קבוצה מהמזרח משחקת נגד קבוצה אחרת מהמזרח, סיכוי הנצחון הוא 50% כי אני מניח שכל הקבוצות במזרח שוות זו לזו, וישנם  3α משחקים כאלה. אם לעומת זאת המזרח משחק נגד המערב סיכוי הנצחון הוא

e/(e+w)

וישנם 3(1-α)- משחקים כאלה. כלומר סך השינוי בכמות הנצחונות של e הוא

3(α/2+(1-α)e/(e+w))

אם כך, ניתן לכתוב את השינוי ליחידת זמן של e ו-w בצורה:

equation

את השורה השניה קיבלנו מהראשונה על ידי החילוף הסימטרי של e ב-w בכל מקום.

מה הן תוצאות המודל ? בגרף 1 למטה רואים את אחוז הנצחונות של המזרח והמערב עם הזמן (הזמן הוא שרירותי, ניתן לחשוב שהוא מס' השבועות). התחלתי עם 60% הצלחה למערב ורק 40% הצלחה למזרח. מכיוון שכל קונפרנס משחק יותר עם עצמו מאשר עם הצד השני אחוז ההצלחה שואף עם הזמן לכיוון ה-50%, כלומר אחוז ההצלחה המערבי יורד עם הזמן בעוד זה של המזרח עולה. בזמן ארוך יותר ממה שנראה בגרף שניהם מתייצבים על 50%.

fig3
אחוז הנצחונות של המזרח והמערב ככל שהעונה מתקדמת. הזמן הוא שרירותי ו- alpha=0.7.

איך זה מסתדר עם נתוני ההצלחה של המזרח והמערב בפועל ? בגרף מס' 2 רואים את אחוז הנצחונות של המזרח והמערב בנקודות זמן שההפרש בינהן הוא בערך 10 ימים. לכל קונפרנס לקחתי את אחוז הנצחונות הממוצע. הנקודות הן הנתונים והקווים השחורים הם מהמודל שלי. רימיתי קצת בשתי נקודות: ראשית, מכיוון שכל קונפרנס מתחיל ביומה הראשון של הליגה ב-50% סיכויי הצלחה ואז "צולל" (מזרח) או "נוסק" (מערב) אל כוחו האמיתי, נקודת ההתחלה היא ה-30 בנובמבר 2014. שנית, לא טרחתי לברר מה הוא האלפא האמיתי ובחרתי ערך של α=0.6, כלומר שכל קבוצה במזרח משחקת 60% ממשחקיה עם קבוצות אחרות במזרח. זה נראה כאילו המגמה היא בעיקרה נכונה אם כי העקמומיות של עקומת הנתונים האמיתיים שונה מזו של המודל.

אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.
אחוז הנצחונות הממוצע של כל קונפרנס (מזרח/מערב) מול מספר הימים מתחילת הליגה. היום הראשון שמופיע הוא ה-30 בנובמבר והאחרון הוא ה-8 לפברואר. קווים שחורים הם קווי המודל עם alpha=0.6.

ניתן להכליל את המודל הפשוט הזה לתיאור של ליגה קצת יותר ריאליסטית בה יש N קבוצות שמשחקות האחת נגד השנייה. כולן מתחילות עם "עוצמה" מסוימת, כלומר אחוז ניצחונות מסוים, ואחוז זה גדל אם קבוצה משחקת נגד קבוצה נחותה ממנה וקטן אם היא משחקת מול קבוצה טובה ממנה. גם כאן מסתבר שכל הקבוצות שואפות לאחוז נצחונות קבוע, כפי שמשתקף מגרף 3.

השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .
השינוי של אחוז הנצחונות עם הזמן עבור "ליגה" בה ישנן 9 קבוצות שמתחילות את העונה עם אחוז הצלחה של 0.1, 0.2, 0.3, . . .

כאן הנחתי שכל קבוצה משחקת באותה תדירות עם כל קבוצה אחרת.

המסקנה העיקרית ממודל מפושט זה היא שאחוז הנצחונות של כל הקבוצות שואף ל-50%.

מנחם לס

מנהל הופס. הזקן והוותיק מכולם בצוות. מנסה לכתוב יומית - כל זמן שאוכל!
Subscribe
Notify of
23 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
גיא
גיא
9 years ago

אלו הרבה חישובים מאוד מסובכים בשביל להגיע לנק' שאם אתה מסתכל על כל הקבוצות יחדיו אז אחוז הנצחונות הוא 50, איך זה יכול להיות אחרת כשבכל משחק יש קבוצה אחת שמנצחת וקבוצה שניה שמפסידה?

שגיא נאור
שגיא נאור
9 years ago

לא הבנתי למה אי אפשר להכניס את הנתונים רק של המפגשים בין הקונפרנסים? מה הערך של המפגשים בתוך הקונפרנס לטובת חיזוק הטענה כי הפערים מצטמצמים? לא יותר פשוט לקחת את כל המפגשים בין הקונפרנסים ולחלק אותם לפי תקופות זמן או לחילופין חלוקה אחרת, נגיד קפיצות של 20 מפגשים? כל קבוצה משחקת בערך 30-35 משחקים נגד קבוצות מהקונפרנס המקביל, כלומר סה״כ בסביבות 400 משחקים בין הקונפרנסים, הכי פשוט יהיה לחלק לקבוצות יותר קטנות ולראות אם יש שינוי עם הזמן.

עגל
עגל
9 years ago

לשגיא – אתה צודק, הנקודה היא שהמשחקים בין הקונפרנסים לא מקטינים את הפערים אלא מגדילים אותם. המשחקים בתוך הקונפרנסים גורמים לאחוז הנצחונות להתקרב ל-50%.
(מסתתרת פה נקודה עדינה שהעוצמה של כל קונפרנס נקבעת לפי אחוז הנצחונות בנקודת זמן מסוימת).
לגיא – סה"כ המאזן של כל הליגה הוא 50% כמו שציינת, כאן אנחנו מתחקים על ההתפלגות הלא טריוויאלית בין שני הקונפרנסים ובעיקר על ההשתנות שלה בזמן.

שגיא נאור
שגיא נאור
9 years ago
Reply to  עגל

ברור שהמשחקים בכל קונפרנס מקרבים ל50% ובגלל זה נראה כאילו ההבדלים אינם כל כך גדולים כי עומדים על בערך 55% למערב אבל דווקא בגלל זה אני לא מבין למה מראש להכניס את אותם מפגשים לתוך המאזן והגרפים. בתכלס, המשחקים בתוך הקונפרנסים לא משנים את הכיוון אבל הם מטשטשים את ההבדל האמיתי, במיוחד בגלל שרוב המשחקים משוחקים בתוך הקונפרנס

מנחם לס
מנחם לס
9 years ago

המוח עייף (וזקן) מדי מכדי להיכנס לזה, אבל כפי שציינתי, ב-ESPN היו משלחמים לך עבור הנסיון.

Berch
Berch
9 years ago

פתרת את הויכוח עתיק היומין בין פילוסוף לסטטיסטיקאי….
מה הסיכוי שתדרוס אותך משאית ?

חישוב הסתברותי מסובך
או 50% – או שכן או שלא…..

יפה לראות תוצאות אמת מסתדרות עם הגרף שלך…. ואל תדאג על הרמאויות הקטנות…. גדולי וטובים ממך (או כמוך) עשו את זה קודם 🙂

אורן
אורן
9 years ago
Reply to  Berch

סתם לידע (אולי אתה יודע..)

בסטטיסטיקה מסתכלים על כל תוצאות העבר ועל כל או רוב המשתנים העיקריים ולפי זה בונים מודלים שמתארים את ההתנהגות של התוצאות לפי הזמן ושאר המשתנים

בהסתברות לוקחים את המודל המתאים וחוזים בעזרתו תוצאות עתידיות בקירוב

זה בגדול. מכאן שהחישובים ההסתברותיים מאוד פשוטים כל עוד יודעים את כל הפרמטרים 🙂

אורן
אורן
9 years ago
Reply to  Berch

הדוגמה הכי טובה שיש לי זה שסטטיסטיקה מראה אחרי משחק כמה כל אחד קלע, באילו אחוזים, איך שומר מסוים השפיע על המשחק שלו..

כך זה מצטבר לעונה שלמה ואפשר להתקדם עם חישובי יעילות יותר מסובכים (השאלה כמה חשיבות נותנים לכל פעולה חיובית כמו נקודה, אסיסט ושלילית כמו איבוד, עבירה) ולראות מי ה-MVP לפי שקלול הדברים.

בעזרת זה בונים מודל הסתברותי ואפשר להשתמש בו לדוגמה במשחקי מחשב שמנתחים התפתחות של שחקן ומכניסים לזה גורמים שונים לכדי rating ושינוי בו, ויכולים גם לבצע סימולציה של משחקים בין קבוצות..

Berch
Berch
9 years ago
Reply to  Berch

זה בדיוק מה שהחבר הסטטיסטיקאי שלי היה אומר…. 🙂

אורן
אורן
9 years ago
Reply to  Berch

D:

Mbk
Mbk
9 years ago

לא ירדתי לסוף דעתך
אולי כי מתפוצץ לי הראש או אולי כי על צד המומי שלי
עניין המשחקים הוא פשוט כל קבוצה משחקת 52 משחקים בתוך הקונפרנס שלה ו 30 מול הקונפרנס היריב

בעקרון לאחר פגרת האול סטאר 40% מקבוצות המערב מחוץ לתמונת הפלייאוף מול 20% מקבוצות המזרח . מעניין לבדוק את ההשפעה הזו על מאזן הקונפרנסים

אורן
אורן
9 years ago

המודל מעניין אבל כמו שנאמר הוא לא יכול להביא למסקנות לגבי הבדל בין חוזק הקונפרנסים

כמו כן אפשר היה קצת לשנות ולגרום לנגזרת חיוביות למי שמתחיל מעל 1/2 ושלילית מתחת ל-1/2.. כך שהחוכמה בעצם היא לקלוע למודל הנכון וזה כמובן הרבה יותר מסובך

בכל מקרה תודה על הפוסטים המעניינים, אולי זה יגרום לאנשים להתעניין קצת יותר באנליטיקס

עגל
עגל
9 years ago
Reply to  אורן

הי אורן, כתבתי פוסט אחר על החוזק של הקונפרנסים, ראה קישור בטור הנוכחי למעלה. זה מחק די נחמד, בעיקר אם הוא עובד. אני די בטוח שהליגה מעסיקה אנשים שיודעים לכתוב מודלים כאלה או יותר ריאליסטיים.

אורן
אורן
9 years ago
Reply to  עגל

כן ראיתי, אחלה פוסט. רק אמרתי שבפוסט הזה זה לא מה שאתה בודק.. תודה.

נתן גולד
נתן גולד
9 years ago

אשכרה פיתחת מערכת דינמית לחזות את מאזן הכוחות…
המרצה שלי עכשיו היה מבסוט. בשבילי לעומת זאת כל המערכות האלה כבר יצאו מכל החורים…

אפלטון
אפלטון
9 years ago

לך תדע אולי הוא המרצה שלך 😉

עגל
עגל
9 years ago

אולי המרצה של נתן הוא סומפולינסקי, אם כן זה משעשע מאוד מפני שלקחתי אצלו שני קורסים של מדעי המוח ברשתות נוירונים.

נתן גולד
נתן גולד
9 years ago
Reply to  עגל

סומפולינסקי הוא לא המרצה במקרה הזה אבל הוא מי שקבע את הסילבוס של הקורס ואני כנראה אעשה אצלו שנה הבאה את רשתות ב'. מצחיק שגם אתה למדת אצלו היה לי את הרושם שאתה בפיזיקה…

עגל
עגל
9 years ago

אני פיסיקאי אבל בצעירותי התעניינתי גם במדעי המוח, עד שסומפולינסקי הצליח להרוג את זה 🙁

נתן גולד
נתן גולד
9 years ago
Reply to  עגל

שמעתי שיש לו השפעה כזאת לפעמים…

bobby
bobby
9 years ago

תמיד שנאתי סטטיסטיקה מורכבת שכזו, אבל סחתיין על המאמץ!
מסכים עם מה שרשמו פה באחת התגובות – ששווה לבדוק האם ריבוי הקבוצות במזרח בעלות סיכוי העפלה לפליאוף לקראת האולסטאר, בניגוד למערב, משפיע בצורה כזו או אחרת..

רועי ויינברג
Admin

אחלה כתבה של הולינגר הישראלי, יש לי שאלה אחת:

אם היית מקטין את אלפא ל-0.5 אז המרחק בין הקווים של המזרח והמערב היה קטן, נכון?

עגל
עגל
9 years ago

ככל שאלפא גדול יותר כך כל קונפרנס משחק יותר עם עצמו ופחות עם הצד השני, ולכן החזק "מפסיד" והחלש "מרוויח", כלומרשני הקווים צריכים להתקרב יותר האחד אל השני.